Kỹ thuật giải trình tự gen thế hệ mới ngs là gì?
Giải trình tự gen thế hệ mới (NGS) là công nghệ xác định trình tự nucleotide trong DNA hoặc RNA với tốc độ cao, chi phí thấp và khả năng phân tích đồng thời hàng triệu đoạn. NGS cung cấp dữ liệu toàn diện về bộ gen, biến thể di truyền và biểu hiện gen, hỗ trợ nghiên cứu y học, di truyền và sinh học phân tử.
Định nghĩa giải trình tự gen thế hệ mới (NGS)
Giải trình tự gen thế hệ mới (Next-Generation Sequencing - NGS) là công nghệ hiện đại cho phép xác định trình tự nucleotide trong DNA hoặc RNA với tốc độ cao, độ chính xác cao và chi phí thấp hơn so với phương pháp Sanger truyền thống. NGS có khả năng giải trình tự hàng triệu đoạn DNA hoặc RNA đồng thời, cung cấp dữ liệu toàn diện về bộ gen, biến thể di truyền, và biểu hiện gen trong các điều kiện khác nhau.
NGS được ứng dụng rộng rãi trong nghiên cứu sinh học phân tử, y học, khảo sát đa dạng sinh học và phát triển liệu pháp cá thể hóa. Công nghệ này cho phép phát hiện các đột biến hiếm, các biến thể di truyền phức tạp, cũng như theo dõi sự tiến hóa của vi sinh vật hoặc quần thể sinh vật.
Khả năng giải trình tự toàn bộ bộ gen hoặc các vùng gen mục tiêu, kết hợp với phân tích bioinformatics, giúp các nhà khoa học và bác sĩ đưa ra quyết định chẩn đoán, điều trị và nghiên cứu chiến lược khoa học một cách chính xác và nhanh chóng hơn so với các phương pháp truyền thống.
Nguyên tắc cơ bản của NGS
NGS dựa trên nguyên tắc khuếch đại mẫu DNA hoặc RNA, gắn thẻ định danh, tổng hợp hoặc đọc từng nucleotide, và phát hiện tín hiệu quang học hoặc điện tử. Quá trình này gồm nhiều bước liên tiếp: phân cắt DNA/RNA, gắn adaptor, khuếch đại, giải trình tự và phân tích dữ liệu.
Công nghệ NGS sử dụng nhiều cơ chế đọc khác nhau như sequencing by synthesis (SBS), sequencing by ligation (SBL), single-molecule real-time (SMRT) và nanopore sequencing. Mỗi phương pháp có ưu điểm riêng về độ dài đọc (read length), tốc độ, độ chính xác và khả năng phát hiện biến thể hiếm.
Đặc điểm nổi bật của NGS so với phương pháp truyền thống là khả năng song song hóa quá trình giải trình tự, cho phép thu thập hàng triệu tín hiệu cùng lúc và giảm đáng kể thời gian cũng như chi phí trên mỗi mẫu.
Quy trình thực hiện NGS
Quy trình thực hiện NGS thường được chia thành các bước cơ bản:
- Chuẩn bị thư viện DNA hoặc RNA: Chia nhỏ mẫu, gắn adaptor để nhận diện và khuếch đại.
- Khuếch đại và gắn thẻ định danh: Tạo nhiều bản sao DNA, thêm mã nhận dạng để phân biệt các mẫu.
- Giải trình tự trên nền tảng NGS: Đọc từng nucleotide dựa trên tín hiệu quang học hoặc điện tử.
- Thu thập dữ liệu thô: Lưu trữ thông tin tín hiệu dưới dạng reads.
- Phân tích dữ liệu: Ghép nối reads, phát hiện biến thể, annotation và chuẩn hóa kết quả.
Bảng minh họa các bước và chức năng tương ứng:
| Bước | Chức năng |
|---|---|
| Chuẩn bị thư viện | Biến DNA/RNA thành dạng phù hợp với máy đọc |
| Khuếch đại & gắn thẻ | Tăng số lượng bản sao và gắn mã nhận dạng |
| Giải trình tự | Xác định trình tự nucleotide |
| Thu thập dữ liệu | Lưu trữ tín hiệu quang học hoặc điện tử |
| Phân tích dữ liệu | Ghép nối reads, phát hiện biến thể và annotation |
Mỗi bước trong quy trình đóng vai trò quan trọng để đảm bảo dữ liệu thu được chính xác, giảm sai sót và tăng khả năng phát hiện các biến thể hiếm hoặc phức tạp trong bộ gen.
Phân loại công nghệ NGS
NGS hiện đại được phân loại theo nguyên lý đọc trình tự và phương pháp phát hiện tín hiệu:
- Sequencing by synthesis (SBS): Đọc từng nucleotide dựa trên tổng hợp DNA, tiêu biểu là nền tảng Illumina, độ chính xác cao, thích hợp giải trình tự quy mô lớn.
- Sequencing by ligation (SBL): Đọc nucleotide dựa trên phản ứng nối oligonucleotide, ví dụ SOLiD, ưu điểm là phát hiện SNP chính xác.
- Single-molecule real-time (SMRT): Đọc trực tiếp một sợi DNA đơn, ví dụ PacBio, cho độ dài đọc dài hơn, thích hợp phát hiện biến thể cấu trúc.
- Nanopore sequencing: Đọc tín hiệu điện tử khi DNA đi qua nanopore, ví dụ Oxford Nanopore, ưu điểm là đọc được đoạn rất dài và thiết bị linh hoạt.
Mỗi loại công nghệ có thế mạnh riêng, được lựa chọn tùy theo mục tiêu nghiên cứu, loại mẫu, độ dài đoạn đọc cần thiết và ngân sách nghiên cứu.
Ưu điểm của NGS
So với phương pháp truyền thống như Sanger sequencing, NGS có nhiều ưu điểm nổi bật. Nó cho phép giải trình tự hàng triệu đoạn DNA/RNA đồng thời, giảm thời gian và chi phí trên mỗi mẫu. Khả năng song song hóa này giúp thu thập dữ liệu toàn diện và phát hiện các biến thể di truyền hiếm và phức tạp mà phương pháp cũ khó tiếp cận.
NGS còn cung cấp khả năng phân tích đa dạng sinh học, khảo sát biểu hiện gen (RNA-Seq) và phát hiện các đột biến hoặc biến thể cấu trúc. Nó cho phép nghiên cứu toàn bộ bộ gen, exome, hay các vùng gen mục tiêu, mang lại thông tin chi tiết về trình tự, số lượng bản sao và mức độ biểu hiện gen.
Danh sách các ưu điểm chính:
- Giải trình tự đồng thời hàng triệu đoạn DNA
- Phát hiện đột biến hiếm, biến thể SNP, indels và biến thể cấu trúc
- Chi phí thấp hơn so với phương pháp truyền thống trên mỗi mẫu
- Phù hợp cho nghiên cứu y học cá thể hóa, ung thư, vi sinh vật và đa dạng sinh học
Ứng dụng của NGS
NGS được ứng dụng rộng rãi trong nhiều lĩnh vực nghiên cứu và thực tiễn:
- Y học và chẩn đoán bệnh di truyền: Phát hiện đột biến gen gây bệnh, theo dõi bệnh lý ung thư và hỗ trợ điều trị nhắm mục tiêu.
- Nghiên cứu ung thư: Phân tích tumor sequencing để xác định đột biến somatic, đột biến hiếm và biến thể cấu trúc trong khối u.
- Microbiome và đa dạng sinh học: Phân tích cộng đồng vi sinh vật, khảo sát vi sinh vật môi trường, đánh giá sự phong phú của vi sinh vật trong đất, nước và cơ thể người.
- Transcriptome sequencing (RNA-Seq): Khảo sát biểu hiện gen, phát hiện isoform, điều hòa gen và biến thể RNA editing.
- Giải mã bộ gen của sinh vật model và cây trồng: Phát triển giống, nghiên cứu tiến hóa và phát hiện gen chức năng.
Chi tiết và các ví dụ về ứng dụng NGS có thể tham khảo tại Genome.gov.
Giới hạn và thách thức
Mặc dù NGS mang lại nhiều lợi ích, nhưng cũng tồn tại các hạn chế và thách thức:
- Dữ liệu khổng lồ yêu cầu hệ thống phân tích bioinformatics mạnh mẽ, tốn tài nguyên tính toán.
- Độ dài đọc ngắn ở một số nền tảng có thể gây khó khăn trong ghép nối trình tự và phát hiện biến thể cấu trúc.
- Bias trong khuếch đại PCR và lỗi thư viện có thể ảnh hưởng đến độ chính xác của kết quả.
- Chi phí đầu tư ban đầu cao cho thiết bị, phần mềm và đào tạo nhân lực.
Bảng tổng hợp các thách thức và giải pháp tiềm năng:
| Thách thức | Giải pháp |
|---|---|
| Dữ liệu lớn | Sử dụng nền tảng điện toán đám mây, thuật toán tối ưu và lưu trữ phân tán |
| Đọc ngắn | Sử dụng công nghệ long-read hoặc hybrid assembly |
| Bias PCR | Tối ưu hóa chuẩn bị thư viện, chuẩn hóa quy trình |
| Chi phí cao | Chia sẻ thiết bị, hợp tác phòng thí nghiệm và thuê dịch vụ NGS |
Xu hướng phát triển NGS
Các xu hướng hiện nay trong NGS bao gồm:
- Tăng độ dài đọc (long-read sequencing) và cải thiện độ chính xác
- Giảm chi phí và thời gian giải trình tự
- Phát triển kỹ thuật single-cell sequencing để phân tích tế bào đơn lẻ
- Tích hợp trí tuệ nhân tạo và machine learning để phân tích dữ liệu khổng lồ, nhận diện biến thể phức tạp
- Ứng dụng NGS trong y học cá thể hóa, dược lý gen, và nghiên cứu vi sinh vật môi trường
Công nghệ NGS đang tiến tới khả năng giải trình tự tức thì và miniaturized sequencing, cho phép giải trình tự ngay tại điểm chăm sóc bệnh nhân hoặc trong điều kiện hiện trường nghiên cứu môi trường.
Tài liệu tham khảo
- Mardis, E.R. (2017). Next-Generation Sequencing Platforms. Annual Review of Analytical Chemistry, 10, 387–402.
- Goodwin, S., McPherson, J.D., & McCombie, W.R. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics, 17, 333–351. Link
- Shendure, J., & Ji, H. (2008). Next-generation DNA sequencing. Nature Biotechnology, 26, 1135–1145.
- Genome.gov. Next-Generation Sequencing Fact Sheet. Link
- Heather, J.M., & Chain, B. (2016). The sequence of sequencers: The history of sequencing DNA. Genomics, 107, 1–8.
Các bài báo, nghiên cứu, công bố khoa học về chủ đề kỹ thuật giải trình tự gen thế hệ mới ngs:
- 1
